การอธิบายแนวคิดหลัก
ในทฤษฎีความน่าจะเป็น เราใช้ภาษาเซตเพื่ออธิบายปรากฏการณ์ที่เกิดขึ้นแบบสุ่ม หากการทดลองใดมีผลลัพธ์ที่เป็นไปได้จำนวนจำกัด เราจะเรียกมันว่าพื้นที่ตัวอย่างจำกัดเช่น
- การโยนเหรียญ: $\Omega = \{h, t\}$
- การโยนเหรียญสองเหรียญ: $\Omega = \{(\text{หน้า, หน้า}), (\text{หน้า, หัว}), (\text{หัว, หน้า}), (\text{หัว, หัว})\}$
นอกจากนี้ การอนุมานทางสถิติมีความสำคัญมากในชีวิตจริง เช่นดัชนีมวลกาย (BMI) การศึกษา สำหรับผู้ใหญ่ชาวจีน กำหนดมาตรฐานดังนี้: $BMI < 18.5$ ถือว่าผอม; $18.5 \le BMI < 24$ ถือว่าปกติ; $24 \le BMI < 28$ ถือว่าอ้วนปานกลาง; $BMI \ge 28$ ถือว่าอ้วน
ตามข้อมูลดัชนีมวลกายของพนักงานชาย 90 คน และพนักงานหญิง 50 คน (ชาย: 23.5, 21.6, 30.6... หญิง: 21.8, 18.2, 25.2...) โปรดเขียนรายงานสถิติ จำนวนคำขั้นต่ำ 200 คำ
1. การแสดงข้อมูลแนะนำให้ใช้แผนภูมิฮิสโตแกรมการแจกแจงความถี่เพื่อแสดงการกระจายของดัชนีมวลกายของพนักงานชายและหญิงแยกกัน หรือใช้แผนภูมิกล่องเพื่อเปรียบเทียบ จากข้อมูล ค่าเฉลี่ยดัชนีมวลกายของพนักงานชายประมาณ 24.2 และพนักงานหญิงประมาณ 22.5
2. การเปรียบเทียบความแตกต่างอัตราส่วนของพนักงานชายที่อ้วน (BMI ≥ 24) สูงกว่าพนักงานหญิงอย่างชัดเจน และปรากฏการณ์การอ้วน (BMI ≥ 28) ส่วนใหญ่อยู่ในกลุ่มพนักงานชาย ขณะที่พนักงานหญิงส่วนใหญ่อยู่ในช่วงปกติ มีบางรายอยู่ในภาวะผอม
3. การวิเคราะห์โดยรวมสภาพสุขภาพโดยรวมของพนักงานบริษัทค่อนข้างดี แต่กลุ่มผู้ชายเผชิญกับความเสี่ยงการมีน้ำหนักเกินสูง อาจเกิดจากพฤติกรรมนั่งทำงานนานหรือขาดการออกกำลังกาย
4. ข้อเสนอแนะบริษัทอาจเพิ่มกิจกรรมยืดเหยียดในช่วงพักช่วงเช้า ติดป้ายพลังงานอาหารในโรงอาหาร และจัดกิจกรรมแบดมินตันหรือวิ่งแข่งขันประจำ สนับสนุนให้พนักงานชายควบคุมน้ำหนัก
จงอธิบายสั้น ๆ: (1) แผนภูมิฮิสโตแกรมการแจกแจงความถี่ให้ข้อมูลอะไรได้บ้าง? (2) ค่าเฉลี่ย ค่ามัธยฐาน ค่ามัธยฐานมีลักษณะอย่างไร? (3) ค่าความแปรปรวนและความเบี่ยงเบนมาตรฐานบ่งบอกอะไร?
(1) แผนภูมิฮิสโตแกรมสามารถมองเห็นแนวโน้มการรวมตัวของข้อมูล ช่วงการเปลี่ยนแปลง และรูปแบบการแจกแจง (เช่น สมมาตรหรือไม่)
(2) แนวโน้มการรวมตัวค่าเฉลี่ยสะท้อนระดับกลาง ได้รับผลกระทบจากค่าที่ผิดปกติ; ค่ามัธยฐานคือค่าที่อยู่กลาง ทนทานต่อการรบกวน; ค่ามัธยฐานสะท้อนค่าที่เกิดขึ้นบ่อยที่สุด
(3) ระดับความแตกต่างค่าความแปรปรวนและค่าความเบี่ยงเบนมาตรฐานสะท้อนขนาดของการเปลี่ยนแปลงของข้อมูล ค่าที่มากขึ้น หมายถึงข้อมูลห่างจากจุดกลางมากขึ้น และมีความไม่เสถียร
กฎของเกม: ทอยเหรียญสองเหรียญพร้อมกัน หากได้หน้าทั้งสองหรือหัวทั้งสอง ฝ่าย ก ชนะ; หากได้หน้ากับหัว ฝ่าย ข ชนะ จงพิจารณาและอธิบายเหตุผล
เกมนี้เป็นธรรม
พื้นที่ตัวอย่าง $\Omega = \{(h, h), (h, t), (t, h), (t, t)\}$ มีจุดตัวอย่างทั้งหมด 4 จุด
เหตุการณ์ที่ฝ่าย ก ชนะ $A = \{(h, h), (t, t)\}$ มีจุดตัวอย่าง 2 จุด ความน่าจะเป็น $P(A) = 2/4 = 0.5$
乙胜的事件 $B = \{(h, t), (t, h)\}$,包含 2 个样本点,概率 $P(B) = 2/4 = 0.5$。
เนื่องจาก $P(A) = P(B)$ ดังนั้นเกมนี้เป็นธรรม
"ใช้ความถี่ $f_n(A)$ ที่เหตุการณ์ A เกิดขึ้น เพื่อประมาณความน่าจะเป็น $P(A)$ เมื่อจำนวนการทดลอง $n$ เพิ่มขึ้น ความแม่นยำจะเพิ่มขึ้น" ข้อความนี้ถูกต้องหรือไม่? โปรดยกตัวอย่างอธิบาย
ข้อความนี้ถูกต้อง เมื่อจำนวนการทดลอง $n$ เพิ่มขึ้น ความถี่ $f_n(A)$ ที่เหตุการณ์สุ่มเกิดขึ้นจะมีเสถียรภาพ คือค่อย ๆ ใกล้เคียงกับความน่าจะเป็น $P(A)$
ตัวอย่างการทอยเหรียญที่สมมาตร 10 ครั้ง อาจได้หน้า 7 ครั้ง (ความถี่ 0.7); ทอย 1,000 ครั้ง จำนวนครั้งที่ได้หน้ามักจะอยู่ที่ประมาณ 500 (ความถี่ใกล้ 0.5); ทอย 100,000 ครั้ง ความถี่จะมีเสถียรภาพสูงมากที่ใกล้ 0.5 นี่ถือเป็นการตีความที่เข้าใจง่ายของกฎของจำนวนมาก